
高考数学斩获139分!小米7B模型比肩Qwen3-235B、OpenAI o3
高考数学斩获139分!小米7B模型比肩Qwen3-235B、OpenAI o3上上周的 2025 高考已经落下了帷幕!在人工智能领域,各家大模型向数学卷发起了挑战。
上上周的 2025 高考已经落下了帷幕!在人工智能领域,各家大模型向数学卷发起了挑战。
和那些看着酷但鸡肋的 AI,可不一样,它是真的管用。 在不久前结束的 Google I/O 上,Google 悄咪咪地在安卓和 iOS 同时上线了一款“旧”app——NotebookLM。发布当日,不到 24 小时,它就夺得苹果 App Store 中生产工具类别的第二名
今天,一位研究者加入 OpenAI 的消息吸引了很多人的关注。
在人工智能领域,ChatGPT 作为 OpenAI 推出的聊天机器人一直以其强大的文字生成能力受到关注。然而近期一项独特的实验显示,当 ChatGPT 与一款诞生于 1977 年(48 年前)的经典游戏机雅达利 2600(Atari 2600)对弈国际象棋时,却遭遇了意想不到的失败。
智东西美国圣何塞6月12日现场报道,今日,年度AI盛会AMD Advancing AI大会火爆开幕,全球第二大AI芯片供应商AMD亮出其史上最强AI新品阵容——旗舰数据中心AI芯片、AI软件栈、AI机架级基础设施、AI网卡与DPU,全面展露与英伟达掰手腕的雄心宏图。
红杉专访OpenAI Codex团队揭示AI编程的未来:从工具协作迈向「异步自主Agent」时代。Codex正从代码补全演化为可独立完成任务的智能体。此外还有更大爆料!
今年苹果在 AI 上宣布的诸多所谓新功能,例如实时翻译、快捷指令等,并无太多革命性;至于视觉智能 (visual intelligence),不仅功能落后 Google Lens 六七年,交互体验上也远未达到一众 Android 友商的内置 AI/Agent 产品在 2025 上半年水平。
测试时扩展(Test-Time Scaling)极大提升了大语言模型的性能,涌现出了如 OpenAI o 系列模型和 DeepSeek R1 等众多爆款。那么,什么是视觉领域的 test-time scaling?又该如何定义?
Ilya 去哪了? 作为 OpenAI 联合创始人,Ilya Sutskever 一直是最靠近 AI 技术核心的人。如今他不再出现在 OpenAI 的发布会现场,而是选择重新开始。
还在让大模型写高考作文?有本事做高考数学卷子。 又是一年高考时。 这届考生上午刚经历了抽象作文的洗礼,下午又被数学无情创飞。